Спецкурс | MаLы DаLи | ||
Основная информация | |||
№ | Пункт | Содержание | |
1 | Направление | Третий Путь | |
2 | Класс | 10 - 11 | |
3 | Тип курса | зачётный только для 10-11-ти классников | |
4 | Преподаватели | Куратцев Владимир, Кадерова Надия | |
5 | Стажёры | ||
6 | Время проведения | Среда 18:55 - 20:15 | |
7 | Цель курса | Познакомить школьников с основами науки о данных (Data Science) и научить применять знания на практике с конкретными типами задач из Machine Learning и Deep Learning | |
8 | Задачи курса | 1. Дать общее представление об истории Data Science 2. Познакомить с основами Python для Data Science 3. Познакомить с основами Data Science (ML,DL) 4. Познакомить с разными типами задач и примерами их решения 5. Дать возможность самостоятельной реализации задач и проектов по Data Science с поддержкой преподавателей |
|
9 | Особенности курса | Адаптированный для школьников курс по Data Science (Machine Learning и Deep Learning). Возможность практики на конкретных задачах и реализации своего проекта с поддержкой преподавателей. Для прохождения курса необходимо наличие дома доступа к компьютеру и интернету. По желанию школьников можно приносить на занятия ноутбук для отработки навыков параллельно лекции | |
10 | Формат проведения занятия (включая использование classroom) | 1) Совмещенный формат: лекция + семинар. Лекционный материал от
преподавателя, разбор кода и параллельное его написание школьниками в
компьютерном классе; 2) Особые виды занятий (экзамен или чаепитие) |
|
11 | Целевая аудитория | Школьники 10-11 классов, заинтересованные в изучении Data Science и имеющие уверенные знания в математике и программировании | |
12 | Краткое описание курса | Адаптированный для школьников 10-11 классов курс науки о данных (Data Science) | |
13 | Количество слушателей | от 10 до 20 человек | |
14 | Отбор | Отбор будет. Письменная работа из задач по математике, информатике, программированию. Задания не привязаны к конкретному языку программированию | |
15 | Формы
контроля и система отчётности |
1. Посещение - 20% 2. Домашняя работа (мини-задачи для практики на основе пройденного материала) - 30% 3. Письменный экзамен - 20% 4. Проект (самостоятельная практическая работа, посвященная решению одного из разобранных на лекциях типов задач на конкретном примере данных) - 30% |
|
16 | Формат курса: онлайн/оффлайн/гибрид. В случае онлайн, какие платформы используются? | оффлайн | |
20 | Дополнительная информация о курсе | ||
Позанятийный план | |||
№ занятия | Дата (Среда) | Тематический блок | План занятия |
1 | 02.10.2024 | Введение. Отбор. | Обсуждение организационных вопросов. Проведение отбора. |
2 | 09.10.2024 | Введение | Введение в историю науки о данных, ее структура и методы. |
3 | 16.10.2024 | Python | Вводное занятие по программированию. Организация работы в компьютерном классе. Google Collab. Anaconda и Jupiter Notebook. Работа с нейросетью (например, Phind, GigaChat) для помощи с написанием кода. |
4 | 23.10.2024 | Python | Основы синтаксиса. Переменные и типы данных. Математические операции. |
5 | 30.10.2024 | Python | Основные структуры: условные конструкции, циклы и функции. Библиотека pandas. Предобработка данных: работа с пропусками. |
6 | 06.11.2024 | Python | Предобработка данных: работа с типами данных, дубликатами. Библиотека matplotlib. Основы визуализации данных. |
7 | 13.11.2024 | Элементы математической статистики | Введение в статистику: вероятность, случайные величины и их распределения, математическое ожидание, дисперсия, медиана, ковариация, корреляция, регрессия. |
8 | 20.11.2024 | Элементы математической статистики | Выборочные характеристики, точечные оценки и их свойства. Методы построения оценок: ММ, ММП, МНК. |
9 | 27.11.2024 | Машинное обучение | Введение в машинное обучение. Задача регрессии. Библиотека scikit-learn. Разбиение данных на выборки. Линейная регрессия. Оценка качества модели регрессии. |
10 | 04.12.2024 | Машинное обучение | Обработка количественных и категориальных признаков. Анализ ошибок модели. Дедлайн №1 по выбору задачи. |
11 | 11.12.2024 | Машинное обучение | Задача классификации. Логистическая регрессия. Оценка качества модели классификации. Дедлайн №2 по структуре проекта. |
12 | 18.12.2024 | Машинное обучение | Метод опорных векторов. Дерево решений. Дедлайн №3 по коду проекта. |
13 | 25.12.2024 | Машинное обучение | Переобучение и недообучение. Регуляризация. Решения проблемы дисбаланса классов. Кросс-валидация. Дедлайн №4 по результатам. |
01.01.2025 | - | ||
08.01.2025 | - | ||
14 | 15.01.2025 | Экзамен | Защита проекта (выступление с презентацией) и письменный экзамен |
15 | 22.01.2025 | Чаепитие | Чаепитие |
16 | 29.01.2025 | Машинное обучение | Задача понижения размерности. Проклятие размерности. Метод главных компонент. t-SNE. |
17 | 05.02.2025 | Машинное обучение | Задача кластеризации. Сложности постановки задачи. Метод K-Means. |
18 | 12.02.2025 | Машинное обучение | Иеархическая кластеризация. DBSCAN. |
19.02.2025 | - | ||
19 | 26.02.2025 | Глубокое обучение | Введение в нейронные сети. Структура нейрона. Определение нейронной сети. Виды нейронных сетей. Полносвязные нейронные сети. |
20 | 05.03.2025 | Глубокое обучение | Сверточные нейронные сети (CNN). Архитектура CNN. Введение в библиотеку PyTorch. Решение задачи классификации с помощью нейронных сетей. |
21 | 12.03.2025 | Глубокое обучение | Реализация CNN для задачи классификации в выбранном фреймворке. Оценка модели. |
22 | 19.03.2025 | Глубокое обучение | Задача распознавания звуков. Особенности и характерные признаки. Принцип работы CNN при обработке аудиоданных. |
23 | 26.03.2025 | Глубокое обучение | Реализация CNN для задачи распознавания звуков в выбранном фреймворке. Оценка модели. Эксперименты с различными параметрами. Дедлайн №1 по выбору задачи. |
24 | 02.04.2025 | Глубокое обучение | Структура нейронной сети для задачи регрессии. Роль активационных функций. Описание архитектур для регрессии. Применение выбранной модели для решения задачи регрессии. Оценка точности и других метрик качества. Дедлайн №2 по структуре проекта. |
25 | 09.04.2025 | Глубокое обучение | Определение временного ряда. Основные статистические характеристики временных рядов. Реккурентные нейронные сети. Принцип работы, особенности и преимущества. Применение обученной нейронной сети для прогнозирования временного ряда. Оценка производительности модели и сравнение со статистическими методами. Дедлайн №3 по коду проекта. |
26 | 16.04.2025 | Глубокое обучение | Определение автоэнкодера. Назначение автоэнкодера. Архитектура автоэнкодера. Метрики оценки качества сжатия. Примеры использования автоэнкодеров для сжатия изображений. Дедлайн №4 по результатам. |
27 | 23.04.2025 | Глубокое обучение | Защита проекта (выступление с презентацией) и письменный экзамен |
28 | 30.04.2025 | Глубокое обучение | Чаепитие |
07.05.2025 | |||
14.05.2025 | |||
21.05.2025 | |||
28.05.2025 | |||
04.06.2025 | |||
11.06.2025 | |||
18.06.2025 | |||
25.06.2025 | |||
Список используемой и рекомендованной литературы | |||
1 | Билл Л. Простой Python. Современный стиль программирования. | ||
2 | Брантон С. Л., Куц Д. Н. Анализ данных в науке и технике. | ||
3 | Дайзенрот М. и др. Математика в машинном обучении. | ||
4 | Джоэл Г. Data Science: Наука о данных с нуля. | ||
5 | Кадурин А., Николенко С., Архангельская Е. Глубокое обучение. Погружение в мир нейронных сетей. | ||
6 | Коул и др. Искусственный интеллект и компьютерное зрение. Реальные проекты на Python, Keras и TensorFlow. | ||
7 | Мюллер, Массарон: Глубокое обучение для чайников. | ||
8 | Савельев В. Статистика и котики. | ||
9 | Фостер Д. Генеративное глубокое обучение. Как не мы рисуем картины, пишем романы и музыку. | ||
10 | https://pythontutor.com/ | ||
11 | https://www.codecamp.ru/tag/pythontuts/ | ||
12 | https://education.yandex.ru/handbook |